Blackwell Arquitectura: Estas son todas las novedades de las RTX 5000

La innovadora arquitectura Blackwell de NVIDIA está dando mucho que hablar. Esta nueva generación de GPUs está estableciendo un nuevo estándar en el rendimiento gráfico y la inteligencia artificial. Esta arquitectura, que impulsa la nueva serie de GeForce RTX 50, introduce avances significativos como la cuarta generación de DLSS, que utiliza IA para mejorar la creación de fotogramas en pantalla, aumentando el rendimiento hasta ocho veces en comparación con el renderizado tradicional. ¿Quieres saber cómo lo consigue?

Índice de contenidos

Especificaciones de las tarjetas gráficas basadas en Blackwell

modelos	RTX 5090	RTX 5080	RTX 5070 Ti	RTX 5070	RTX 5060 Ti	RTX 5060
Chip	GB202	GB203	GB203	GB205	GB207	GB207
Nodo de fabricación	TSMC 4N	TSMC 4N	TSMC 4N	TSMC 4N	TSMC 4N	TSMC 4N
Recuento de transistores (miles de millones)	92.2	45.6	45.6	31.0	–	–
Tamaño del chip (mm2)	750	378	378	263	–	–
Streaming Multiprocessors	170	84	70	48	36	24
Shaders (ALUs)	21760	10752	8960	6144	4608	3072
Tensor cores	680	336	280	192	144	96
Ray Tracing Units	170	84	70	48	36	24
Frecuencia de reloj (Mhz)	2407	2617	2452	2512	2500	2500
Velocidad VRAM (Gbps)	28	30	28	28	30	28
Capacidad VRAM (GB)	32	16	16	12	8	8
Ancho de bus VRAM	512	256	256	192	128	128
Memoria caché L2	96	64	48	48	32	24
TFLOPS FP32	104.8	56.3	43.9	30.9	23.0	15.4
TFLOPS FP16 (INT8 TOPS)	838 (3352)	450 (1801)	352 (1406)	247 (988)	199 (737)	133 (492)
Ancho de banda (GB/s)	1792	960	896	672	480	448
TBP (vatios)	575	360	300	250	200	150

También te recomiendo leer nuestro artículo sobre las mejores tarjetas gráficas del mercado

Un poco de historia sobre NVIDIA Blackwell

Blackwell, rinde homenaje al matemático afroamericano David Harold Blackwell, reconocido por sus aportes en teoría de juegos, probabilidad, teoría de la información y estadística. Estos campos han influido directamente en el desarrollo de modelos de IA generativa basados en transformadores y sus algoritmos de entrenamiento. Blackwell también fue el primer académico de color en ser admitido en la Academia Nacional de Ciencias de EE. UU.

NVIDIA lleva tiempo usando epónimos (nombres de personajes históricos ilustres para los nombres clave de sus arquitecturas). Estos epónimos son Ada Lovelace, Ampere, Hopper, Tesla, Maxwell, Turing, Volta, etc., o la arquitectura Rubin, por Vera Rubin, que llegará dentro de unos años…

En 2024, NVIDIA ya anunció que las futuras tarjetas gráficas para consumo estarían basadas en esta arquitectura Blackwell, además de sus aceleradores B100, B200 y otros productos para distintos sectores de mercado. Esta nueva arquitectura viene diseñada con la IA muy presente, tanto a nivel de hardware como a nivel de software, apoyándose sobre esta tecnología para conseguir mayor rendimiento, eficiencia y mejoras en el gaming, así como potenciar las nuevas aplicaciones de IA generativas para creadores.

En octubre de 2024 llegaron malas noticias para Blackwell, ya que se filtró a los medios que la arquitectura presentaba un defecto de diseño que NVIDIA solucionó en colaboración con TSMC, para así permitir la fabricación de estos chips sin problema bajo el nodo de 4NM, y sin alterar las previsiones de la compañía Graphzilla. Según Jensen Huang, CEO de la compañía verde, este problema era funcional, y solo afectaba al yield, es decir, a la cantidad de chips válidos por wafer, ya que parece que el problema reducía la cantidad de chips funcionales en cada oblea de silicio.

No obstante, Blackwell sigue con algunos problemas, en este caso no técnicos, sino de suministro, ya que debido a la demanda de chips para IA, NVIDIA ha reconocido que no podrá abastecer a tiempo toda la demanda de chips…

Te recomiendo leer nuestra guía sobre la mejor configuración gaming

Detalles técnicos de la arquitectura Blackwell

Blackwell es una arquitectura diseñada tanto para aplicaciones de cómputo en centros de datos como para juegos y estaciones de trabajo, una unificación de ambos productos como también hará AMD con su UDNA, que unifica RDNA y CDNA. Los chips GPU Blackwell se fabrican en el nodo personalizado TSMC 4NP, una evolución del nodo 4N utilizado en las arquitecturas Hopper y Ada Lovelace. Este proceso mejora la eficiencia energética y el rendimiento sin un cambio significativo en la tecnología de fabricación en cuanto a tamaño de transistores.

El GB100, orientado a centros de datos, cuenta con 104 mil millones de transistores, un aumento del 30% respecto al GH100 de Hopper. Para superar las limitaciones del tamaño del chip, Nvidia ha fusionado dos chips GB100 en un solo empaquetado, conectados mediante la interfaz o interposer NV-HBI (High Bandwidth Interface) con un ancho de banda de 10 TB/s. Para el mercado de consumo, el mayor chip de Blackwell, el GB202 (RTX 5090), tiene 750 mm² y 24,576 núcleos CUDA, un 28.5% más que el AD102 de Ada Lovelace.

Unidades de procesamiento

Aunque Blackwell comparte algunos detalles técnicos con la anterior generación, dado que es una evolución, también se han introducido cambios y novedades en las unidades de procesamiento, de ahí las mejoras en el rendimiento de estos nuevos chips. Estas mejoras clave son:

CUDA Compute Capability 10.0 y 12.0.
5ª Generación de Tensor Cores, con soporte para FP4 y FP6 para acelerar aplicaciones IA, aumentando la eficiencia y el rendimiento en inferencia de modelos de IA generativa.
4ª Generación de los núcleos Ray Tracing para geometrías más complejas, mejorando el rendimiento en Ray Tracing, duplicando la tasa de intersección de rayos y triángulos en comparación con Ada Lovelace.
Y un batallón de tecnologías novedosas que iremos comentando en otros artículos del blog, como la nueva DLSS 4, RTX AI, y mucho más…

Otra de las mejoras de Blackwell está en la salida de vídeo, con conectores DisplayPort 2.1 UHBR20 capaz de alcanzar los 20 Gbps, un importante paso adelante respecto a la arquitectura anterior. Una alta velocidad que no llega sola, ya que los motores de codificación y decodificación han pasado a ser de 9ª y 6ª generación respectivamente, consiguiendo grandes mejoras en cuanto al tratamiento de vídeo para AV1, H.264, 4 2 2 y MV-HEVC.

Memoria: GDDR7 y caché L2 mejorada

Las GPU Blackwell utiliza memoria GDDR7, proporcionando velocidades de hasta 36 Gbps (con variantes de hasta 40 Gbps en el futuro). La RTX 5090, 5080 y 5070 Ti usan GDDR7 a 28 Gbps, mientras que la RTX 5080 contará con una variante a 30 Gbps. En comparación con la RTX 4090, esto representa un aumento del 33% en ancho de banda.

Además, NVIDIA continuará apostando por una gran caché L2, lo que mejora el rendimiento efectivo de la memoria al reducir accesos innecesarios a la VRAM. Algo que tendrá un impacto positivo en el rendimiento general, y en la cantidad de FPS generada en videojuegos.

Eficiencia energética

Una de las cosas que se reumoreaban es que las RTX 50 Series serían enormes y con un consumo preocupante, sin embargo, esto no ha sido así. Tanto los avances en el diseño de Blackwell como el nuevo nodo de fabricación de TSMC han conseguido que la eficiencia y rendiniento por vatio se vean muy beneficiados en esta generación de GPUs.

Además, se ha actuado especialmente en tres frentes para conseguir grandes mejoras respecto a Ada, como:

Clock gating, para adaptar la frecuencia de reloj de forma dinámica para consumir solo lo necesario según la carga de trabajo de cada momento.
Power gating, para reducir la alimentación siempre que la frecuencia lo permita sin generar inestabilidad, aportando menos voltios y por tanto menos consumo y una temperatura más baja.
Rail gating, para reducir el consumo de energía al apagar por completo secciones del chip cuando no están en uso. Es decir, pudiendo apagar los núcleos si no se están usando, manteniendo el estado en memoria.

Por supuesto, todo esto ha conseguido ahorros energéticos de hasta el 50%, que no es nada despreciable. Además, la tecnología de escalado de frecuencia dinámico y de voltaje (DVFS) se ha mejorado para que el cambio de frecuencia sea mucho más rápido, como se aprecia en las imágenes anteriores, mejorando tanto el rendimiento cuando se demanda más frecuencia para cargas pesadas, como también reduciendo el consumo al ajustar la frecuencia a un nivel más bajo cuando no es necesaria.

También me gustaría agregar que las tarjetas RTX 50-series seguirán utilizando el conector 16 pines ATX 12V-2×6, la versión mejorada del criticado 12VHPWR de la RTX 4090. NVIDIA asegura que los problemas térmicos han sido resueltos con esta revisión, así que no debería haber ningún problema al respecto, como se vieron en las primeras RTX 40 Series en su lanzamiento…

Tus comentarios serán bienvenidos…

Isaac2 febrero, 2025

6 minutos de lectura aproximada.